Convencerlos de:
Marc Lipsitch, Director, works on modeling the transmission of Coronavirus disease 2019.
Carolina Buckee, expert in transmission of infectious diseases through populations
Michael Mina, develops and tests high-throughput serological surveillance of infectious pathogens
Todos del Center for Communicable Disease Dynamics en Harvard
58,000 = 2% de la población!
Son diferentes
Modelos matemáticos: hacen predicciones basados en ecuaciones diferenciales tratando de describir como funciona la naturaleza.
Modelos estadísticos: ajustan modelos a datos observados basado en modelos que han funcionado en el pasado para situaciones parecidas.
Visualización de datos: usa menos supuestos, pero permite descubrir patrones visualmente.
“It’s hard to make predictions especially about the future” - Yogi Berra
“Forecasting s-curves is hard” - Constance Crozier

Source: Puerto Rico Institute of Statistics
Trata de estimar la prevalencia: el porciento de rojos ya que no podemos probar a todos.
Si solo hacemos pruebas a los sintomáticos el estimado es bien sesgado: mucho mayor que la tasa actual.
Si hacemos pruebas más universalmente, el estimado es menos sesgado. Los casos reportados aumentan con el número de pruebas aunque no aumente la tasa.
Si hacemos pruebas más universalmente nuestra precisión mejora. Pero si la tasa real es baja esto puede ser una desperdicio de recursos.
No se compartía cuántas pruebas se habían hecho.
Massachusetts, que en mi opinion está monitoreando bien, lleva calculando y reportando la tasa de positividad por meses.
https://www.mass.gov/info-details/covid-19-response-reporting#covid-19-daily-dashboard-
También monitorean las hospitalizaciones y muertes.
Obviamente esos resultados no son confiables. Pero ahora esto va a mejorar pues tenemos datos compartidos por:
También tenemos datos de hospitalizaciones:
Una vez los datos están bien organizados, hacer una visualización es fácil:
hosp <- read_xlsx("data/Dash Total.xlsx")
hosp %>%
ggplot(aes(Fecha, `Total de Personas Hospitalizadas COVID`)) +
geom_point() + geom_smooth(span = 0.3)
Muertes en marzo 2019: 2489
Muertes en marzo 2020: 2720
Estimar el exceso es más complicado que simplemente restar estos dos porque:
Otro reto es que los datos del reigstro demográfico toman como 45 días en estar completos:
Aquí vemos porque no debemos comparar solo dos años: